4.5.3 가상-현실 간극(Sim-to-Real Gap)을 줄이는 하드웨어: 시뮬레이션 충실도(Fidelity)를 고려한 하드웨어 설계 전략

4.5.3 가상-현실 간극(Sim-to-Real Gap)을 줄이는 하드웨어: 시뮬레이션 충실도(Fidelity)를 고려한 하드웨어 설계 전략

인공지능, 특히 심층 강화학습(Deep Reinforcement Learning, DRL)이 로봇 제어의 새로운 지평을 열었다는 사실은 부인할 수 없다. 소프트웨어 2.0의 시대에 로봇은 더 이상 명시적인 코드 라인으로 제어되지 않으며, 시뮬레이션 환경에서의 수백만 번에 걸친 시행착오를 통해 최적의 정책(Policy)을 학습한다. 그러나 이 화려한 성공의 이면에는 ’가상-현실 간극(Sim-to-Real Gap)’이라는 거대한 장벽이 존재한다. 시뮬레이터에서 완벽하게 걷고 뛰던 로봇이 현실 세계에서는 첫걸음조차 떼지 못하고 넘어지는 현상은 Embodied AI 연구자들에게는 익숙한 좌절이다.1

지금까지 학계와 산업계는 이 문제를 주로 알고리즘 차원에서 해결하려 노력했다. 도메인 무작위화(Domain Randomization), 시스템 식별(System Identification), 그리고 메타 러닝(Meta-Learning)과 같은 기법들은 불확실한 현실 세계를 확률 분포로 모델링하여 정책의 강건성(Robustness)을 높이는 데 기여했다.3 하지만 관점을 전환할 필요가 있다. 만약 하드웨어 자체가 시뮬레이션과 친화적으로 설계된다면 어떨까? 로봇의 기계적 특성이 물리 엔진의 수학적 모델과 일치하도록 설계된다면, 알고리즘이 감당해야 할 불확실성의 총량은 획기적으로 줄어들 것이다.

본 절에서는 “시뮬레이션을 위한 설계(Design for Simulation)“라는 새로운 설계 철학을 제시한다. 이는 전통적인 기계공학적 최적화—단순히 토크를 높이거나 무게를 줄이는 것—를 넘어, 학습 알고리즘이 현실 세계로 전이될 때 겪는 물리적 괴리를 하드웨어 레벨에서 최소화하는 전략이다. 우리는 액추에이터의 투명성(Transparency), 기어박스의 선형성(Linearity), 센서의 관측 가능성(Observability), 그리고 구조적 강성(Rigidity)이 어떻게 Sim-to-Real 성능을 결정짓는지 심층적으로 분석하고, 이를 구현하기 위한 구체적인 하드웨어 아키텍처를 논의한다.

1. 물리적 불확실성의 기원과 시뮬레이션 충실도

Sim-to-Real Gap의 근본 원인은 시뮬레이터가 현실 세계의 복잡성을 완벽하게 모사할 수 없다는 데 있다. Isaac Gym, MuJoCo, Gazebo와 같은 현대의 물리 엔진들은 계산 효율성을 위해 강체 역학(Rigid Body Dynamics)을 기반으로 하며, 현실의 비선형적인 물리 현상들을 단순화된 수식으로 근사한다.5 따라서 하드웨어 설계자는 시뮬레이터가 ‘싫어하는’ 물리적 현상이 무엇인지 이해하고, 이를 하드웨어에서 제거하거나 정형화해야 한다.

1.1 시뮬레이션이 놓치는 하드웨어의 미세 동역학

시뮬레이션과 현실의 괴리를 만드는 하드웨어적 요인은 크게 마찰(Friction), 유연성(Flexibility), 그리고 지연(Latency)으로 범주화할 수 있다.

첫째, **비선형 마찰과 백래시(Backlash)**는 시뮬레이션의 가장 큰 적이다. 기어박스 내부의 쿨롱 마찰(Coulomb Friction)과 점성 마찰(Viscous Friction), 그리고 기어 이빨 사이의 유격인 백래시는 모델링하기 매우 까다롭다. 특히 로봇이 정지 상태에서 움직이기 시작하거나 방향을 바꿀 때 발생하는 스틱-슬립(Stick-Slip) 현상은 불연속적인 동역학을 만들어낸다. 시뮬레이터는 이러한 불연속 구간을 부드럽게 처리하거나 무시하는 경향이 있어, 저속 제어 영역에서 심각한 간극을 유발한다.8

둘째, **구조적 유연성(Structural Flexibility)**이다. 시뮬레이터는 대부분의 링크를 변형되지 않는 강체(Rigid Body)로 가정한다. 그러나 실제 로봇의 링크, 벨트, 그리고 직렬 탄성 액추에이터(SEA)의 스프링은 부하에 따라 미세하게, 혹은 눈에 띄게 변형된다. 이러한 유연성은 제어 대역폭(Bandwidth) 내에서 구조적 공진(Structural Resonance)을 일으키거나, 엔드 이펙터의 위치 오차를 유발하여 학습된 정책의 안정성을 해친다.10

셋째, 지연 시간(Latency)과 센서 노이즈이다. 시뮬레이션 내에서 센서 데이터의 취득과 액추에이터 명령의 실행은 이상적인 타이밍에 이루어진다. 반면 실제 하드웨어에서는 센서 처리 시간, 통신 버스(CAN, EtherCAT)의 지터(Jitter), 모터 드라이버의 응답 지연 등이 복합적으로 작용한다. 특히 비가우시안(Non-Gaussian) 노이즈 특성을 가진 센서는 시뮬레이션의 단순한 백색 노이즈 모델과 큰 차이를 보인다.1

1.2 Design for Control에서 Design for Simulation으로

전통적인 로봇 설계 철학인 ’제어를 위한 설계(Design for Control)’는 하드웨어의 대역폭을 높이고 제어기가 다루기 쉬운 선형 시스템을 만드는 데 집중했다. Embodied AI 시대의 하드웨어는 여기에서 한 걸음 더 나아가 **‘시뮬레이션 모델과의 일치성(Model Conformity)’**을 최우선 가치로 삼아야 한다.

만약 하드웨어의 거동이 선형적이고 예측 가능하다면, 저충실도(Low-Fidelity) 시뮬레이션만으로도 성공적인 Sim-to-Real 전이가 가능하다.7 반대로 하드웨어가 복잡한 비선형성을 내포하고 있다면, 아무리 정교한 고충실도 시뮬레이션(High-Fidelity Simulation)을 사용하더라도 간극을 메우기 어렵다. 따라서 Sim-to-Real Gap을 줄이는 하드웨어 설계의 핵심은 물리적 복잡성을 제거하여 시뮬레이터의 이상적인 모델(Ideal Model)에 가깝게 동작하도록 하드웨어를 ’단순화’하고 ’정제’하는 것이다.

2. 액추에이터 설계: 투명성(Transparency)과 역구동성(Backdrivability)의 확보

로봇의 관절을 구동하는 액추에이터는 Sim-to-Real Gap이 발생하는 가장 주된 진원지이다. 모터, 감속기, 그리고 모터 드라이버로 구성된 구동계는 마찰, 관성, 탄성 등 복합적인 동역학적 특성을 가지며, 이는 정책 학습의 성패를 좌우한다.

2.1 유사 직구동(Quasi-Direct Drive, QDD)의 부상과 물리적 이점

최근 4족 보행 로봇(MIT Mini Cheetah, Unitree Go2)과 동적 휴머노이드 로봇 설계에서 가장 두드러진 트렌드는 유사 직구동(QDD) 방식의 채택이다.14 QDD는 높은 토크 밀도를 가진 BLDC 모터(일반적으로 팬케이크 형상의 아웃러너 모터)와 낮은 감속비(통상 10:1 이하, 최대 20:1)의 단일 스테이지 유성 기어(Planetary Gear)를 결합한 형태이다.

2.1.1 반사 관성(Reflected Inertia)의 최소화와 충돌 모델링

QDD가 Sim-to-Real에 유리한 가장 큰 이유는 반사 관성을 획기적으로 낮출 수 있기 때문이다. 로봇의 링크 측에서 느끼는 모터 로터의 관성(J_{eff})은 감속비(N)의 제곱에 비례하여 증가한다.
J_{eff} = J_{load} + N^2 J_{motor}
전통적인 산업용 로봇에 사용되는 파동 기어(Strain Wave Gear, N \approx 100)나 사이클로이드 기어는 반사 관성을 수만 배 증폭시킨다. 이로 인해 로봇은 외부 환경과의 충돌 시 매우 ‘딱딱하게’ 반응하며, 시뮬레이션 상의 부드러운 접촉 모델과 큰 괴리를 보인다. 반면, QDD는 낮은 감속비를 사용하여 반사 관성을 최소화함으로써, 로봇이 외부 힘에 즉각적으로 순응(Compliance)하게 만든다. 이는 시뮬레이션에서 모델링하는 이상적인 질량-관성 시스템과 실제 로봇의 동역학적 거동을 일치시키는 핵심 요인이다.17

2.1.2 전류 기반 토크 제어의 선형성

QDD는 높은 역구동성(Backdrivability)을 가진다. 이는 모터 축에 가해지는 외부 힘이 감속기의 마찰에 의해 손실되지 않고 모터 로터로 전달됨을 의미한다. 이러한 특성은 별도의 고가 토크 센서(Strain Gauge) 없이도 모터의 전류(Current) 측정만으로 관절 토크를 정확하게 추정하고 제어할 수 있게 한다.8 전류와 토크 사이의 관계(\tau = K_t \cdot I)가 선형적일수록, 시뮬레이터 내의 이상적인 액추에이터 모델은 실제 하드웨어와 잘 들어맞는다. 즉, 정책 네트워크가 “10Nm의 토크를 출력하라“는 행동(Action)을 결정했을 때, 실제 하드웨어가 마찰이나 관성에 의한 왜곡 없이 정확히 10Nm를 출력할 수 있다면 Sim-to-Real Gap은 자연스럽게 소멸한다.

2.2 직렬 탄성 액추에이터(SEA)의 딜레마와 학습 기반 보정

직렬 탄성 액추에이터(SEA)는 모터와 부하 사이에 의도적으로 스프링을 배치하여 충격 흡수와 힘 제어 능력을 높이는 방식이다(예: 초기 ANYmal 모델). SEA는 하드웨어 보호와 안전성 측면에서는 우수하지만, 시뮬레이션 모델링 관점에서는 복잡성을 증가시키는 요인이 된다.14

스프링의 탄성은 시스템의 차수(Order)를 증가시키고, 특정 주파수에서 공진을 유발한다. 시뮬레이터에서 스프링의 강성(Stiffness)과 댐핑(Damping), 그리고 히스테리시스(Hysteresis)를 완벽하게 튜닝하는 것은 매우 어렵다. 이러한 모델 불일치는 고속 운동 제어 학습 시 정책의 발산으로 이어진다. 이를 극복하기 위해 최근 연구들은 두 가지 방향으로 진화하고 있다.

  1. 하드웨어적 회귀: SEA 대신 고대역폭 제어가 가능한 QDD를 사용하여 물리적 탄성을 제거하고, 소프트웨어적으로 가상 임피던스(Virtual Impedance)를 구현하는 방식(예: ANYmal C에서 ANYmal D로의 진화).
  2. Actuator Network의 도입: 물리적 스프링의 비선형성을 제거할 수 없다면, 액추에이터의 입출력 관계를 딥러닝으로 학습하여 시뮬레이터에 통합하는 방식이다. “Learning to Walk in the Real World with Minimal Human Effort“와 같은 논문에서는 실제 액추에이터의 데이터를 기반으로 **액추에이터 네트워크(Actuator Net)**를 학습시키고, 이를 물리 엔진의 액추에이터 모델로 사용하여 SEA의 복잡한 동역학을 시뮬레이션에 반영함으로써 Sim-to-Real 성능을 비약적으로 향상시켰다.14

2.3 기어박스 선정: 마찰과 유격의 통제

기어박스는 토크를 증폭시키는 필수 요소이지만, 동시에 마찰과 백래시라는 불확실성을 주입한다. 시뮬레이션 충실도를 고려한 기어박스 선정 전략은 다음과 같이 분석된다.

기어박스 유형Sim-to-Real 적합성물리적 특성 및 하드웨어 전략
유성 기어 (Planetary Gear)최상 (\star\star\star)구조가 단순하고 마찰 모델링이 용이하다. QDD와 결합 시 역구동성이 뛰어나며, 백래시가 존재하지만 예측 가능한 수준으로 관리 가능하다. 고속 다족 보행 로봇에 표준으로 자리 잡았다.16
하모닉 드라이브 (Harmonic Drive)중간 (\star\star)백래시가 거의 없는(Zero Backlash) 특성은 정밀 제어에 유리하다. 그러나 ’Flexspline’의 탄성 변형으로 인한 ‘Soft Wind-up’ 현상과 높은 내부 마찰은 모델링을 어렵게 한다. 이를 사용하려면 시뮬레이터에 별도의 마찰 모델(LuGre 등)과 유연성 모델을 추가해야 한다.9
사이클로이드 (Cycloidal Drive)중간 (\star\star)내충격성이 우수하나, 편심 구동으로 인한 토크 리플(Torque Ripple)이 크고 비선형적이다. 최근 연구에서는 핀(Pin) 기반 설계를 통해 마찰을 줄이고 학습 기반 토크 추정기를 도입하여 선형성을 개선하고 있다.17
자기 기어 (Magnetic Gear)도전적 (\star)기계적 접촉이 없어 마찰과 마모가 없고 백래시가 이론상 제로에 가깝다. 그러나 자력 간섭, 탈조(Pole Slipping), 그리고 복잡한 자기 탄성 효과는 현재의 강체 시뮬레이터로는 구현하기 매우 어렵다. 특수한 목적 외에는 Sim-to-Real에 불리하다.21

전략적 결론: 강화학습 기반의 제어를 염두에 둔다면, 백래시가 없거나 예측 가능한 기어 시스템을 선택해야 한다. 만약 고감속비 기어가 필수적이라면, 기어박스 출력단에 고정밀 인코더나 토크 센서를 배치하여 기어박스 내부의 비선형성을 제어 루프 내에서 상쇄할 수 있는 하드웨어 구조를 갖추어야 한다.

3. 센서 시스템 설계: 노이즈 정형화와 상태 관측의 확실성

하드웨어가 아무리 이상적으로 움직여도, 로봇이 자신의 상태(State)와 환경(Environment)을 정확히 인지하지 못하면 정책은 실패한다. 시뮬레이션 충실도를 높이는 센서 설계 전략은 노이즈의 특성을 단순화하고, 상태 추정(State Estimation)의 불확실성을 하드웨어적으로 제거하는 데 초점을 맞춘다.

3.1 센서 노이즈의 모델링 용이성 (Modelability)

시뮬레이터는 일반적으로 센서 노이즈를 가우시안 분포(Additive White Gaussian Noise)로 가정한다. 그러나 실제 센서는 바이어스(Bias), 드리프트(Drift), 양자화 오차(Quantization Error), 그리고 온도와 같은 환경 변수에 의존적인 복잡한 노이즈를 포함한다.1 하드웨어 설계자는 이러한 ‘더러운’ 노이즈를 ‘깨끗한’ 노이즈로 바꾸는 부품을 선정해야 한다.

  • MEMS IMU의 선정: 저가형 IMU는 진동에 취약하고 온도 드리프트가 심하다. Sim-to-Real을 위해서는 진동 정류 오차(Vibration Rectification Error, VRE)가 낮은 고성능 MEMS 센서를 사용하거나, 하드웨어적으로 진동 댐퍼(Damper) 위에 IMU를 마운트하여 기계적 노이즈를 1차 필터링해야 한다. 이는 시뮬레이션의 이상적인 가속도계 모델과 실제 데이터의 간극을 줄여준다.
  • 고해상도 인코더의 필수성: 낮은 분해능의 인코더가 유발하는 양자화 노이즈는 속도 미분 시 거대한 스파이크를 만들어내며, 이는 제어 정책을 불안정하게 한다. 14-bit 이상의 절대 인코더(Absolute Encoder)를 사용하여 양자화 효과를 무시할 수 있는 수준으로 낮추거나, 아날로그 \sin/\cos 출력을 가진 인코더를 사용하여 보간(Interpolation) 성능을 극대화해야 한다.24

3.2 시각 센서의 시간적 동기화와 셔터 방식

비전 기반의 강화학습(Visual RL)에서 가장 치명적인 문제는 **지연 시간(Latency)**과 **모션 블러(Motion Blur)**이다.

  • Global Shutter vs. Rolling Shutter: 롤링 셔터 방식의 카메라는 고속으로 움직이는 로봇에서 젤로 효과(Jello Effect)와 이미지 왜곡을 발생시킨다. 시뮬레이터의 렌더링 엔진은 모든 픽셀을 동시에 캡처하는 글로벌 셔터 방식을 따르므로, 실제 하드웨어에서도 반드시 글로벌 셔터 카메라를 사용하여 시각 정보의 기하학적 왜곡을 제거해야 한다.25
  • 하드웨어 동기화: 카메라 이미지와 IMU, 관절 인코더 데이터가 서로 다른 시점의 정보를 담고 있다면 정책 학습은 불가능하다. 하드웨어 트리거(Hardware Trigger) 기능을 지원하는 센서들을 선정하여, 마이크로초(µs) 단위의 시간 동기화를 하드웨어 레벨에서 보장해야 한다. 이는 시뮬레이션의 동기화된 시간 스텝(Time Step)과 현실 시스템을 일치시키는 기본 조건이다.

3.3 센서 배치(Sensor Placement)와 구조적 필터링

센서의 물리적 위치는 데이터의 품질과 시뮬레이션 일치도를 결정한다.

  • IMU 배치와 유연체 모드: 로봇의 몸체는 완전한 강체가 아니므로 진동 모드(Vibration Mode)가 존재한다. IMU를 구조적 진동이 가장 심한 곳(예: 캔틸레버 끝단)에 배치하면, 시뮬레이션에는 없는 고주파 진동이 측정되어 상태 추정기를 교란한다. 따라서 구조 해석(FEA)을 통해 진동 노드(Node)나 강성이 가장 높은 부위에 IMU를 배치하는 **‘센서 위치 최적화’**가 수행되어야 한다.26
  • 접촉 센서의 기구학적 격리: 발바닥이나 그리퍼의 접촉 센서는 충격에 직접 노출된다. 센서가 파손되지 않으면서도 미세한 힘을 감지할 수 있도록, 충격은 구조물이 흡수하고 접촉 압력만 센서로 전달되는 기구학적 필터링 구조를 설계해야 한다. 이는 시뮬레이션의 접촉 모델(Contact Solver)이 계산하는 접촉력과 실제 센서 값의 상관관계를 높여준다.28

4. 구조 및 형태학적 설계: 시스템 식별(System ID)을 위한 최적화

로봇의 기구학적 구조(Kinematics)와 질량 분포(Mass Distribution)는 시뮬레이션 모델 파라미터(URDF, MJCF 파일)와 정확히 일치해야 한다. 이를 위해 하드웨어는 **‘식별 용이성(Identifiability)’**과 **‘모델 단순성’**을 갖추어야 한다.

4.1 질량 집중(Mass Concentration)과 강체 근사

대부분의 고속 물리 엔진은 링크를 강체로 가정하고 계산한다. 하드웨어 설계는 이 가정에 부합하도록 이루어져야 한다.

  • Proximal Actuation: 무거운 모터와 배터리를 관절 회전축이나 몸체 중심부에 가깝게 배치하여 다리나 팔의 말단부 질량(Distal Mass)을 최소화한다. 이는 다리의 관성 모멘트를 줄여 빠른 움직임을 가능하게 할 뿐만 아니라, 링크를 단순한 막대(Rod) 모델로 근사했을 때 발생하는 오차를 줄여준다. Unitree Go2나 Spot과 같은 로봇들이 모터를 몸체 쪽에 배치하고 링키지(Linkage)나 벨트로 구동력을 전달하는 이유가 여기에 있다.29
  • 고강성 소재의 사용: 링크의 휨이나 비틀림은 시뮬레이션 모델에 없는 자유도(Unmodeled DOF)를 추가하는 것과 같다. 카본 파이버(Carbon Fiber)나 항공 우주 등급 알루미늄을 사용하여 무게 대비 강성을 극대화함으로써, 로봇이 물리 엔진 속의 강체처럼 거동하도록 강제해야 한다.18

4.2 시스템 식별 친화적 설계 (Design for System ID)

로봇 제작 후 시뮬레이션 파라미터를 튜닝하는 과정(System ID)은 필수적이다. 하드웨어는 이 과정을 돕도록 설계되어야 한다.

  • 분리 가능한 모듈러 구조: 각 다리나 팔을 몸체에서 쉽게 분리하여 단독으로 테스트할 수 있는 구조는 개별 링크의 질량, 무게중심, 관성 모멘트를 정밀하게 측정할 수 있게 한다. 이는 전체 로봇 모델의 정확도를 높이는 ‘Divide-and-Conquer’ 접근법을 가능하게 한다.31
  • 캘리브레이션 마커 및 포인트: 로봇 외형에 모션 캡처용 마커를 부착하기 쉬운 지점을 미리 설계하거나, 조인트의 절대 영점을 기계적으로 정렬할 수 있는 핀 홀(Pin Hole)을 마련하여 기구학적 파라미터(링크 길이, 오프셋)의 오차를 최소화해야 한다.

5. 사례 연구: Sim-to-Real을 완성하는 하드웨어 솔루션

이론적 원칙들이 실제 최신 로봇 하드웨어에 어떻게 적용되었는지 구체적인 사례를 통해 살펴본다.

5.1 Unitree Go2와 4족 보행 로봇의 진화

Unitree Go2는 Sim-to-Real 기술의 집약체라 할 수 있다. 이 로봇은 6~8:1 수준의 낮은 감속비를 가진 QDD 액추에이터를 채택하여 기계적 임피던스를 낮췄다.

  • System ID의 통합: 최근 연구(“Sampling-Based System Identification with Active Exploration for Legged Robot Sim2Real Learning” 33)에 따르면, Go2는 하드웨어 자체의 투명성을 활용하여 능동적인 시스템 식별을 수행한다. 로봇이 스스로 다양한 동작을 수행하며 수집한 데이터를 바탕으로 시뮬레이션의 마찰 계수와 관성 파라미터를 역으로 추정하고, 이를 통해 강화학습 정책을 재학습시킨다.
  • 발바닥 설계: 초기 모델과 달리 최신 4족 로봇들은 발바닥을 반구형(Hemispherical) 고무로 제작하여 지면과의 접촉점을 명확히 하고, 시뮬레이션의 점 접촉(Point Contact) 모델이 현실에서도 유효하도록 유도한다.34

5.2 RialTo: 디지털 트윈을 위한 조작(Manipulation) 하드웨어

RSS 2024에서 발표된 RialTo 프로젝트는 “Real-to-Sim-to-Real” 파이프라인을 통해 조작 기술을 학습한다.35

  • 그리퍼의 설계: RialTo 시스템에서 사용되는 그리퍼는 시뮬레이션이 어려운 복잡한 유연체 대신, 변형이 예측 가능한 소재나 강체 기반의 핑거팁을 사용하여 접촉 시뮬레이션의 정확도를 높인다. 또한, 그리퍼 끝단에 부착된 카메라는 물체와의 상호작용을 근거리에서 관측하여, 시뮬레이션 상의 물체 포즈 추정(Pose Estimation) 오차를 줄이는 데 기여한다.
  • 환경의 재구성: 하드웨어뿐만 아니라 로봇이 조작하는 환경(선반, 책상 등)을 스캐닝하여 디지털 트윈으로 즉석에서 생성함으로써, 기하학적 불일치(Geometric Mismatch)를 제거하는 접근법을 취한다.

5.3 FalconGym과 드론 하드웨어의 공기역학적 단순화

드론의 비행 제어는 공기역학적 복잡성으로 인해 Sim-to-Real이 매우 어렵다. FalconGym 연구는 이를 하드웨어와 소프트웨어의 공진화로 해결했다.12

  • 선형화된 추진 시스템: 모터와 프로펠러의 추력(Thrust) 관계를 풍동 실험을 통해 정밀하게 측정하고, 이를 바탕으로 ESC 펌웨어를 튜닝하여 RPM과 추력 간의 관계를 선형화했다. 이는 시뮬레이터의 단순한 추력 모델이 실제 드론에도 적용되도록 하드웨어를 ‘길들인’ 사례이다.
  • 강체 프레임: 공기역학적 변형이 적은 고강성 카본 프레임을 사용하여, 비행 중 프레임 진동에 의한 제어 불안정성을 제거하고 시뮬레이션의 강체 가정을 만족시켰다.

6. 형태와 정책의 공진화 (Co-Evolution): 미래의 하드웨어

이제 하드웨어는 고정된 상수가 아니라, AI 모델의 성능을 극대화하기 위해 변화할 수 있는 변수이다. **“형태와 정책의 동시 최적화(Co-Design Optimization)”**는 로봇의 다리 길이, 관절 위치, 센서 배치를 강화학습 에이전트가 학습하는 과정에서 함께 최적화하는 기술이다.37

미분 가능한 시뮬레이터(Differentiable Simulator)의 등장은 이러한 공진화를 가속화하고 있다. 하드웨어 파라미터를 미분 가능한 변수로 설정하면, 로봇이 더 잘 걷거나 물체를 더 잘 잡기 위해 자신의 하드웨어 설계를 어떻게 바꿔야 하는지 그라디언트(Gradient)를 통해 계산할 수 있다. 이는 궁극적으로 **‘Sim-to-Real Gap이 0이 되는 하드웨어’**를 AI가 직접 설계하는 미래를 예고한다.

7. 결론

가상-현실 간극을 줄이는 하드웨어 설계 전략은 단순히 좋은 부품을 사용하는 것을 넘어, 시뮬레이터가 이해할 수 있는 언어로 하드웨어를 기술하는 과정이다. 이를 요약하면 다음과 같은 핵심 원칙으로 귀결된다.

  1. 선형화(Linearization): QDD, 저마찰 기어, 고해상도 센서를 통해 하드웨어의 물리적 비선형성을 제거한다.
  2. 투명성(Transparency): 액추에이터의 반사 관성을 낮추고 역구동성을 확보하여, 소프트웨어의 명령이 즉각적이고 정직하게 물리적 출력으로 변환되도록 한다.
  3. 관측 가능성(Observability): 센서의 배치와 종류를 최적화하여 로봇의 내부 상태와 외부 상호작용을 명확하게 디지털화한다.
  4. 강체화 및 단순화(Rigidization & Simplification): 시뮬레이션의 기본 가정인 강체 역학을 만족시키기 위해 구조적 불확실성을 억제한다.

Embodied AI를 위한 하드웨어는 더 이상 차가운 금속 덩어리가 아니다. 그것은 지능을 담는 그릇이며, 가상의 지능이 현실 세계에 발현될 수 있도록 돕는 물리적 인터페이스이다. Simulation Fidelity를 고려한 하드웨어 설계는 차세대 로봇 개발의 선택이 아닌 필수 조건이며, 소프트웨어와 하드웨어의 경계를 허무는 진정한 융합의 시작점이 될 것이다.

설계 요소전통적 로봇 공학 접근Sim-to-Real 고려 Embodied AI 접근주요 구현 기술
액추에이터고감속비, 위치 정밀도 중심QDD (유사 직구동), 토크 제어, 투명성 중시BLDC, 유성 기어, Actuator Net 14
기어박스효율, 소형화, 백래시 허용선형성, 모델링 용이성, 제로 백래시하모닉(모델 보정), 유성 기어
센서노이즈 필터링 후처리 의존원시 데이터 접근, 노이즈 정형화, 동기화Global Shutter, 고해상도 인코더, 최적 배치
구조 설계안전율, 내구성 중심시스템 식별 용이성, 강체 근사, 질량 집중카본 복합재, 모듈러 설계, Topology Opt.
제어 전략모델 기반 제어 (MPC, PID)데이터 기반 제어 (RL), End-to-End 학습On-board Inference (Jetson Orin) 5

8. 참고 자료

  1. The Reality Gap in Robotics: Challenges, Solutions, and Best Practices - arXiv, https://arxiv.org/html/2510.20808v1
  2. The Reality Gap in Robotics, https://robotics-reality-gap.github.io/
  3. SIM2REAL: How to Reduce the Reality Gap in Robotics - Reinforcement Learning Path, https://www.reinforcementlearningpath.com/sim2real
  4. Curriculum Design and Sim2Real Transfer for Reinforcement Learning in Robotic Dual-Arm Assembly - MDPI, https://www.mdpi.com/2075-1702/12/10/682
  5. Closing the Sim-to-Real Gap: Training Spot Quadruped Locomotion with NVIDIA Isaac Lab, https://developer.nvidia.com/blog/closing-the-sim-to-real-gap-training-spot-quadruped-locomotion-with-nvidia-isaac-lab/
  6. MATLAB and Simulink for Autonomous System Design » Student Lounge - MathWorks Blogs, https://blogs.mathworks.com/student-lounge/2019/02/27/robotics-system-design-matlab-simulink/
  7. Task-Informed Fidelity Management for Speeding Up Robotics Simulation - Oren Salzman, https://orensalzman.com/docs/ISRR19-sim.pdf
  8. BRIDGING THE SIM-TO-REAL GAP FOR ATHLETIC LOCO-MANIPULATION - OpenReview, https://openreview.net/pdf?id=0HwPNCqQft
  9. Precision Gearboxes for Robotics | High-Torque & Low-Backlash, https://www.norckrobotics.com/collections/precision-gearboxes
  10. Full article: Automated rigid bodies synthesis for AM compliant mechanisms, https://www.tandfonline.com/doi/full/10.1080/17452759.2025.2551083
  11. Automatic design of compliant medical instruments using bionic structural optimization methods - mediaTUM, https://mediatum.ub.tum.de/doc/1601324/1601324.pdf
  12. FalconGym: A Photorealistic Simulation Framework for Zero-Shot Sim-to-Real Vision-Based Quadrotor Navigation - arXiv, https://arxiv.org/html/2503.02198v2
  13. Task-Informed Fidelity Management for Speeding Up Robotics Simulation - ResearchGate, https://www.researchgate.net/publication/336869572_Task-Informed_Fidelity_Management_for_Speeding_Up_Robotics_Simulation
  14. Cycloidal Quasi-Direct Drive Actuator Designs with Learning-based Torque Estimation for Legged Robotics - arXiv, https://arxiv.org/html/2410.16591v1
  15. Quasi-Direct Drive Actuation for a Lightweight Hip Exoskeleton with High Backdrivability and High Bandwidth - PMC - NIH, https://pmc.ncbi.nlm.nih.gov/articles/PMC7971415/
  16. Why focus on the QDD Actuator (Quasi Direct Drive Actuator)? - Bonsystems, https://en.bonsystems.com/newsletter/qdd-actuator/
  17. Cycloidal Quasi-Direct Drive Actuator Designs with Learning-based Torque Estimation for Legged Robotics - ResearchGate, https://www.researchgate.net/publication/385140227_Cycloidal_Quasi-Direct_Drive_Actuator_Designs_with_Learning-based_Torque_Estimation_for_Legged_Robotics
  18. Bridging the Sim-to-Real Gap for Athletic Loco-Manipulation - arXiv, https://arxiv.org/html/2502.10894v1
  19. Harmonic Drive Gear Failures in Industrial Robots Applications: An Overview - PHM Society, https://papers.phmsociety.org/index.php/phme/article/download/2849/1801
  20. Cycloidal Quasi-Direct Drive Actuator Designs with Learning-based Torque Estimation for Legged Robotics - arXiv, https://arxiv.org/html/2410.16591v2
  21. Two Models for Time-Domain Simulation of Hybrid Magnetic Bearing’s Characteristics - NIH, https://pmc.ncbi.nlm.nih.gov/articles/PMC8878507/
  22. Load-Based Variable Transmission Mechanism for Robotic Applications - arXiv, https://www.arxiv.org/pdf/2512.15448
  23. Chapter 6 From Simulation to Real Robots with Predictable Results: Methods and Examples, https://tsapps.nist.gov/publication/get_pdf.cfm?pub_id=902330
  24. Modeling and Diagnosis of Friction and Wear in Industrial Robots - Diva-Portal.org, http://www.diva-portal.org/smash/get/diva2:738580/FULLTEXT03.pdf
  25. ACSim: A Novel Acoustic Camera Simulator with Recursive Ray Tracing, Artifact Modeling and Ground Truthing - IEEE Xplore, https://ieeexplore.ieee.org/iel8/8860/4359257/10967163.pdf
  26. Survey of Motion Tracking Methods Based on Inertial Sensors: A Focus on Upper Limb Human Motion - MDPI, https://www.mdpi.com/1424-8220/17/6/1257
  27. IMU-Based Systems For Skiing Sports: A Scoping Review - IEEE Xplore, https://ieeexplore.ieee.org/iel8/6287639/10820123/11145904.pdf
  28. AnyRotate: Gravity-Invariant In-Hand Object Rotation with Sim-to-Real Touch - arXiv, https://arxiv.org/html/2405.07391v3
  29. Bridging the Gap to Bionic Motion: Challenges in Legged Robot Limb Unit Design, Modeling, and Control - PubMed Central, https://pmc.ncbi.nlm.nih.gov/articles/PMC12364437/
  30. Sampling-Based System Identification with Active Exploration for Legged Robot Sim2Real Learning - LeCAR Lab, https://lecar-lab.github.io/spi-active_/static/pdf/spi_active_arxiv.pdf
  31. Hardware Design for Autonomous Robot Evolution - White Rose Research Online, https://eprints.whiterose.ac.uk/id/eprint/166131/1/ICES_Hardware_Design_for_Autonomous_Robot_Evolution.pdf
  32. Hardware design of modular robotic system - SciSpace, https://scispace.com/pdf/hardware-design-of-modular-robotic-system-1q6gnjn4d9.pdf
  33. [Literature Review] Sampling-Based System Identification with Active Exploration for Legged Robot Sim2Real Learning - Moonlight, https://www.themoonlight.io/en/review/sampling-based-system-identification-with-active-exploration-for-legged-robot-sim2real-learning
  34. Sampling-Based System Identification with Active Exploration for Legged Robot Sim2Real Learning - arXiv, https://arxiv.org/html/2505.14266v1
  35. Precision home robots learn with real-to-sim-to-real - MIT EECS, https://www.eecs.mit.edu/precision-home-robots-learn-with-real-to-sim-to-real/
  36. Reconciling Reality through Simulation: A Real-To-Sim-to-Real Approach for Robust Manipulation - Robotics: Science and Systems, https://roboticsconference.org/2024/program/papers/15/
  37. Robust Co-Design for Canonical Underactuated Systems, https://thesis.unipd.it/retrieve/c1554c2a-2178-48b1-aeb2-3d43295c7523/RobusTCoDesign_FedericoGirlanda.pdf
  38. Soft Robots Learn to Crawl: Jointly Optimizing Design and Control with Sim-to-Real Transfer, https://www.roboticsproceedings.org/rss18/p062.pdf